Fundamental limitations of genomic language models for realistic sequence generation
该研究通过全面评估发现,现有的基因组语言模型(如 Evo 2 和 megaDNA)虽能捕捉局部序列统计特征,但在保留长距离基因组组织、重复元件及进化约束等关键生物学特性上存在系统性缺陷,导致生成的合成序列极易被区分,从而揭示了当前架构在真实基因组生成方面的根本局限性。
49 篇论文
合成生物学是一门将工程思维融入生命系统的迷人学科,它让科学家像设计电路一样重新编写和构建生物体。从设计能生产药物的微生物到创造可降解塑料的细菌,这一领域正在以前所未有的速度改变我们对生命的理解与应用方式。
在 Gist.Science 上,我们密切关注 bioRxiv 发布的每一篇相关预印本。我们的团队会对这些最新研究进行深度处理,提供既通俗易懂又保留关键细节的技术解读,帮助读者跨越专业术语的障碍,快速把握前沿动态。
以下为您精选了合成生物学领域最新发布的研究论文,它们代表了该方向上最激动人心的探索与发现。
该研究通过全面评估发现,现有的基因组语言模型(如 Evo 2 和 megaDNA)虽能捕捉局部序列统计特征,但在保留长距离基因组组织、重复元件及进化约束等关键生物学特性上存在系统性缺陷,导致生成的合成序列极易被区分,从而揭示了当前架构在真实基因组生成方面的根本局限性。
该研究通过构建高多样性荧光蛋白基因库并扩充训练数据,成功将机器学习模型的预测能力从外推转化为内插,从而实现了在自然序列分布之外发现功能性荧光蛋白的设计。
该研究表明,利用大语言模型(如 Gemini 2.5 Pro)结合外部 API 进行合成核酸订单的客户合法性筛查,在准确率上可与人类专家媲美,同时在源质量、保真度及成本效益(仅为人工成本的约十分之一甚至五十分之一)方面表现更优,支持在合成生物学领域试点采用"AI 负责信息收集、人类保留最终决策权”的混合筛查模式。
该研究利用工程化大肠杆菌全细胞生物传感器,揭示了炎症小鼠肠道中宿主黏蛋白来源的唾液酸在空间分布上的动态变化及其与疾病状态的关联,并展示了该技术在监测快速代谢物原位生物利用度及指导治疗方面的潜力。
该研究通过在合成细胞中构建并筛选针对多个基因的组合 DNA 文库,成功优化了 DNA 自复制器和磷脂合成途径等蛋白质系统的功能,并验证了利用单突变数据预测多基因组合变体适应度的可行性,为未来人工细胞的进化工程奠定了基础。
该研究通过升级大肠杆菌正交复制系统 EcORep 并成功将其拓展至生长最快的细菌维氏弧菌(VinORep),构建了突变率接近生物极限的便携式连续基因进化平台,实现了在 16 小时内通过积累数十个突变快速获得新功能。
本文介绍了 CyanOperon 系统,这是 CyanoGate MoClo 工具包的一项扩展,旨在通过提供标准化的载体和组装策略,实现大肠杆菌和聚球藻中合成操纵子的灵活构建、多基因表达及染色体整合。
该研究开发了一种可编程的相分离 RNA-蛋白唾液酸纳米颗粒(sialogranules),其通过高亲和力结合流感病毒受体并作为诱饵,有效抑制了流感病毒进入细胞。
该研究通过优化无细胞基因表达体系(补充高活性 T7 RNA 聚合酶并降低核糖体浓度),成功将单拷贝 DNA 模板在微滴中的蛋白产量提升了约 10 倍,从而实现了对低浓度 DNA 输入下稳健信号读出的突破。